手术动作三胞胎识别提供了对手术场景的更好理解。这项任务具有很高的相关性,因为它为外科医生提供了背景感知的支持和安全性。当前改善绩效的首选策略是开发新的网络机制。但是,当前最新技术的性能大大低于其他手术任务。为什么会发生这种情况?这是我们在这项工作中解决的问题。我们提出了第一项研究,以了解现有的深度学习模型通过稳健性和解释的镜头的失败。首先,我们通过对抗优化方案研究了当前的现有模型。然后,我们通过基于功能的解释提供故障模式。我们的研究对提高性能和提高可靠性的关键是核心和虚假属性。我们的工作为外科科学中更具可信赖性和可靠性的深度学习模型打开了大门。
translated by 谷歌翻译
自动诊断阿尔茨海默氏病的前驱阶段与患者治疗以改善生活质量非常相关。我们将此问题作为多模式分类任务解决。多模式数据提供了更丰富和互补的信息。但是,现有技术仅考虑数据与单个/多模式成像数据之间的低阶关系。在这项工作中,我们为阿尔茨海默氏病的诊断引入了一个新型的半监督超图学习框架。我们的框架允许多模式成像和非成像数据之间建立高阶关系,同时需要一个小标记的集合。首先,我们引入了一种双重嵌入策略,用于构建保留数据语义的强大超图。我们通过使用基于对比的机制在图像和图形级别上执行扰动不变性来实现这一目标。其次,我们通过半阐释流动进行动态调整的超晶扩散模型,以改善预测性不确定性。我们通过实验证明,我们的框架能够优于阿尔茨海默氏病诊断的当前技术。
translated by 谷歌翻译
医疗图像注册和细分是多种临床程序的关键任务。这些任务的手动实现是耗时的,质量高度取决于医师的专业水平。为了减轻这项费力的任务,已经开发了自动工具,其中大多数解决方案都是有监督的技术。但是,在医疗领域中,拥有代表性的基础真理的强有力假设远非现实。为了克服这一挑战,已经研究了无监督的技术。但是,它们的性能仍然有限,并且无法产生合理的结果。在这项工作中,我们提出了一个新型的统一的无监督框架,用于图像注册和分割,我们称为PC-Swinmorph。我们框架的核心是两种基于补丁的策略,我们证明补丁表示是性能增益的关键。我们首先引入了基于补丁的对比策略,该策略可执行当地条件和更丰富的特征表示。其次,我们利用一个3D窗口/移动的窗口多头自发项模块作为补丁缝制策略,以消除贴片分裂中的人工制品。我们通过一组数值和视觉结果证明,我们的技术优于当前最新的无监督技术。
translated by 谷歌翻译
半监督的学习受到了最近的关注,因为它减轻了对大量标签数据的需求,这些数据通常很昂贵,需要专家知识并耗时收集。深度半监督分类的最新发展已经达到了前所未有的表现,而受监督和半监督学习之间的差距一直在挑战。这种绩效的改善是基于包含众多技术技巧,强大的增强技术和具有多项损失功能的昂贵优化方案。我们提出了一个新的框架,即laplacenet,以进行深度半监督分类,该分类大大降低了模型的复杂性。我们利用一种混合方法,在该方法中,通过将图表上的laplacian能量最小化来产生伪标记。然后,这些伪标签被用来迭代训练神经网络骨架。在几个基准数据集上,我们的模型优于深度半监督分类的最先进方法。此外,我们在理论上考虑了强大化对神经网络的应用,并证明使用多样采样方法对半监督学习的使用是合理的。我们通过严格的实验证明,多样采样增强方法可以改善概括并降低网络对增强的敏感性。
translated by 谷歌翻译
Superpixels在众多计算机视觉任务中用作强大的预处理工具。通过使用Superpixel表示,图像基元的数量可以大大降低倍数。随着近年来深度学习的兴起,少数作品试图将深受学习的特征/图饲养成现有的经典超像素技术。然而,他们都没有能够在近乎实时生产超像素,这对超像素在实践中适用性至关重要。在这项工作中,我们提出了一个基于图形的基于图形的Superpixel分割框架。在第一阶段,我们介绍了一种高效的深度亲和学习(DAL)网络,通过聚合多尺度信息来学习成对像素亲和力。在第二阶段,我们提出了一种称为分层熵速率分割(HERS)的高效超像素方法。使用来自第一阶段的学习亲和力,HERS构建了一个分层树结构,可以瞬间产生任何数量的高度自适应超像素。我们通过视觉和数值实验证明,我们的方法的有效性和效率与各种最先进的超像素方法相比。
translated by 谷歌翻译
在社区中广泛调查了语义分割,其中最先进的技术基于监督模型。这些模型报告了前所未有的性能,以需要大量的高质量细分面具。为了获得这种注释是非常昂贵的并且特别是在需要像素级注释的语义分割中。在这项工作中,我们通过提出作为半监督语义细分的三级自我训练框架的整体解决方案来解决这个问题。我们技术的关键思想是提取伪掩模统计信息,以减少预测概率的不确定性,同时以多任务方式执行分段一致性。我们通过三级解决方案实现这一目标。首先,我们训练分割网络以产生粗糙的伪掩模,预测概率非常不确定。其次,我们使用一个多任务模型来减少伪掩模的不确定性,该模型强制利用数据丰富的数据统计信息。我们将采用现有方法与半监督语义分割的现有方法进行比较,并在广泛的实验中展示其最先进的性能。
translated by 谷歌翻译
医疗图像分割是一项相关任务,因为它是多个诊断过程的第一步,因此在临床使用中是必不可少的。尽管已经使用监督技术报告了重大成功,但他们假设一套具有良好代表性的标签集。这是在医学领域中的一个有力的假设,在医学领域,注释昂贵,耗时且人类偏见固有。为了解决这个问题,文献中已经提出了无监督的技术,但由于学习任何转换模式的困难,它仍然是一个开放的问题。在这项工作中,我们介绍了一个新型的优化模型,构成了一个新的基于CNN的对比登记结构,用于无监督的医学图像分割。我们方法的核心是从对比度学习机制中利用图像级注册和特征级别,以执行基于注册的细分。首先,我们提出了一个体系结构,以通过注册进行无监督的医学图像分割来捕获图像到图像转换模式。其次,我们将一种对比的学习机制嵌入了注册体系结构中,以增强网络在功能级别中的区分能力。我们表明,我们提出的技术减轻了现有无监督技术的主要缺点。我们通过数值和视觉实验证明,我们的技术在两个主要的医疗图像数据集上的当前无监督分割方法显着优于当前的最新无监督分割方法。
translated by 谷歌翻译
鉴于获得大量标记数据的潜在困难,许多作品探索了使用深度半监督学习,它使用标记和未标记的数据来培训神经网络架构。绝大多数SSL方法侧重于实现低密度分离假设或一致性假设,决策边界应该位于低密度区域的想法。但是,它们通过对每个数据点的决策边界进行本地更改来实现这一假设,忽略了数据的全局结构。在这项工作中,我们使用群集数据中存在的全局信息来探索替代方法来更新我们的决策边界。我们提出了一种新颖的框架,Cyclecluster,用于深度半监督分类。我们的核心优化由基于新的聚类正则化以及基于图形的伪标签和共享的深网络的基于群集的正规化驱动。展示集群假设的直接实现是基于流行的一致性正规化的可行替代方案。我们通过仔细的数值结果展示了我们技术的预测能力。
translated by 谷歌翻译
Specular microscopy assessment of the human corneal endothelium (CE) in Fuchs' dystrophy is challenging due to the presence of dark image regions called guttae. This paper proposes a UNet-based segmentation approach that requires minimal post-processing and achieves reliable CE morphometric assessment and guttae identification across all degrees of Fuchs' dystrophy. We cast the segmentation problem as a regression task of the cell and gutta signed distance maps instead of a pixel-level classification task as typically done with UNets. Compared to the conventional UNet classification approach, the distance-map regression approach converges faster in clinically relevant parameters. It also produces morphometric parameters that agree with the manually-segmented ground-truth data, namely the average cell density difference of -41.9 cells/mm2 (95% confidence interval (CI) [-306.2, 222.5]) and the average difference of mean cell area of 14.8 um2 (95% CI [-41.9, 71.5]). These results suggest a promising alternative for CE assessment.
translated by 谷歌翻译
我们介绍了NLP社区Metasurvey的结果。从2022年5月到2022年6月,该调查引起了关于有争议的问题的意见,包括该领域的行业影响,对AGI和道德规范的关注。我们的结果将具体数字置于几个争议中:例如,受访者几乎完全将有关人工通用智能的重要性的问题分为一半,语言模型是否理解语言以及语言结构的必要性以及解决NLP问题的必要性。此外,调查提出了元问题,要求受访者预测调查响应的分布。这不仅使我们不仅可以深入了解NLP研究人员所拥有的各种信念,还可以揭示社区预测与现实不符的错误社会学信念。我们在各种问题上发现这种不匹配。除其他结果外,社区大大高估了其对基准的实用性的信念,以及扩展解决现实世界中问题的潜力,同时低估了其对语言结构,归纳偏见和跨学科科学重要性的信念。
translated by 谷歌翻译